データサイエンスや機械学習の分野で研究・開発を行うためには、使いやすいプログラミング環境が欠かせません。 本資料では、次の2つのツールを導入していきます。
これらを組み合わせて使うことで、授業や研究だけでなく、業界でも通用する「プロフェッショナルな作業環境」を自分のPCに整えることができます。
下図が環境のイメージです。
1回この環境を完成させれば、卒業まで困ることはありません。頑張ってまいりましょう。ひとつだけ注意点をお伝えします。
ここで行う作業の後半では、「半角文字でコマンドを入力する」という慣れない操作を行うことがあります。この操作は煩雑に見えますが、最も簡単なやり方は、書かれいてるコマンドを慎重に選択→コピーして、ペーストする(貼り付ける)ことです。コピーとペーストはマウスやタッチバッドのの右クリックで実行できます。
現在、Intel CPUを搭載したIntel Mac(少し古いMac)と、ARM CPUを搭載したSilicon Mac(現行品; M1ーM4といった名前がついている)の2種類のMacが流通しています。多くの人はSilicon Macを使っているはずですが、念のため確認してみましょう。
画面左上端に林檎マークのアイコンがあり、これをクリックして「このMacについて」を選択します。
出現するウィンドウには、機種名の下にチップという項目があり、そこにCPUの名称が書かれています。
「Apple M1 (またはM2, M3, M4)」ならば、お使いのMacはApple Silicon です。
「Intel Core i7 (または i5)」ならば、Intelです。下の図では、チップがApple M1なので、Apple Siliconであることが分かります。
Mac OSの標準アプリ「ターミナル.app」を起動します。 このアプリは次の場所にあります:
アプリケーション(フォルダ) > ユーティリティ(フォルダ) > ターミナル
起動すると、次のような外観の(殺風景な)ウィンドウが出現します。
Miniforgeのインストール作業では、このターミナルに幾つかの命令をタイプ(入力)していきますので、起動したままにしてください。
以上で準備は完了です!
SafariやChromeなどで、MiniforgeのWebサイト: https://conda-forge.org/download/にアクセスします:
上の準備で調べたように、お使いのMacがApple Silicon
か Intel
のどちらかに応じて、適切なインストーラーをダウンロードしましょう。私のMacの場合は、CPUはM1だったので、Apple
Siliconのarm64 (Apple Silicon)をクリックしてダウンロードします。
ダウンロードしたインストーラーは、「ダウンロード」フォルダに保存されています。このフォルダにターミナルからアクセスします。
ターミナルのカーソル部分をクリックして、次のコマンドを入力してください。
cd Downloads
このコマンドは「ダウンロードフォルダに移動する」という意味です。アルファベット・空白ともに半角で入力することに注意(以降も同様です)。その結果、ターミナルの表示が
ユーザー名@PC名 Downloads %
に変更されたら成功です(下図参照)。以降のターミナル作業は、ダウンロードフォルダの中で行われることになります。
それではインストール作業を始めます。まず、次のコマンドを正確にマウスでコピーしてください。
bash Miniforge3-$(uname)-$(uname -m).sh
次に、ターミナルのカーソル付近にマウスを移動して、右クリック→ペーストを選択してください。コピーしたコマンドを貼り付けようとしています。
うまく貼り付けられたら、下の画像のようになるはずです。うまくいかなかったら、バックスペースキーをタイプして貼り付けた内容を全削除してリトライします。
Enter(リターン)キー↩︎️を叩きます。すると、Miniforgeインストーラーが起動します。下図のように
Welcome to Miniforge3...のようなメッセージと、ターミナルの最終行に>>>というプロンプトが表示されていることを確認します。
Enterキーをタイプすると、ライセンスが表示されます。私たちは同意する必要があります。下図の画面の状態でキーボードの
q をタイプします。
すると、画面が少し変化し、ターミナル最下部あたりに
Do you accept the license terms?(ライセンスに同意しますか?)という質問が表示されます。yesとタイプして、Enter↩︎️します。
次に、Miniforgeをインストールするフォルダを決定します。デフォルトでは、みなさんのホームフォルダ直下に:
/Users/(ユーザー名)/miniforge3
というフォルダを新規作成し、その中にMiniforgeシステムをインストールします。ところが、ユーザー名に空白が入っていたり、日本語やヨーロッパ系のアクセント文字が入っていると、うまく動かないことが知られています。私のユーザー名(tam)のように、空白のない半角文字のみならばその心配はないので、ここでは以下の指示をスキップし、ENTERキーを入力して次の「4.」に進んでもOKです。
それ以外の人、よく分からない人は、以下の手順を踏みます。現在、ターミナルではインストール先のフォルダを指定する局面にいます(下図)。
このカーソルのところに、次のように入力してください。半角英数字、大文字小文字の区別、「/」(スラッシュ記号、キーボードの右下あたりにあります)に注意。入力すると、下図のようになります。
/Users/Shared/miniforge3
この/Users/Sharedという場所は、Macでは「共有」というフォルダとして見えています。「共有フォルダの中にminiforge3というフォルダを新規作成し、その中にMiniforgeをインストールしていく」、ということを意味しています。
さて、ここでENTERキーを入力すると、インストール作業が自動的に始まります。下図は実行中の画面です。
その結果、Macに最初から作られている「共有」フォルダの中に「miniforge3」フォルダが新規作成され、Miniforgeシステムを構成するファイルたち(Pythonなど)がコピーされていきます。
最後にもうひとつ質問が表示されます。Miniforgeではcondaというコマンドを使ってPython環境を管理します。そこで、「あなたのMacのPython系プログラム・アプリはもう全てcondaの管理に任せますか?」という質問なのです。
Transaction finished
installation finished.
Do you wish to update your shell profile to automatically initialize conda?
This will activate conda on startup and change the command prompt when activated.
If you'd prefer that conda's base environment not be activated on startup,
run the following command when conda is activated:
conda config --set auto_activate_base false
You can undo this by running `conda init --reverse $SHELL`? [yes|no]
[no] >>> この最後の質問には 「Yes」で対応します。yes
(すべて半角小文字)とタイプして、[ENTER]します。
ターミナルにThank you for installing Miniforge3!と表示されていれば、成功です。以上の作業で、MiniforgeはみなさんのMacにインストールされました!
ここまでの作業がうまくいかなかったり、途中でエラーっぽい症状が出て先に進めない場合、miniforgeを再インストールする必要はまったくありません。むしろ悪影響を及ぼす可能性があります。こんなときは、遠慮なく私の研究室までMacを持参してください。すぐに治して使えるようにします。
次は、Miniforgeを用いて、Pythonプログラミング環境の初期設定を行っていきます。ターミナルはまだ使いますので、そのままで!
Pythonプログラミング環境を準備したり整えたりするツールがconda(コンダ)です。ターミナルでcondaを使えるかどうか確認します。
実行してもターミナルには特に変化がおきませんが、これによってcondaコマンドが使えるようになっているはずです。ターミナルにconda [ENTER]と入力し、下のような出力が現れることを確認しましょう。
もしも、
conda: command not foundと出力されたら、ターミナルでcondaコマンドが使えないことを意味します。
ターミナルで、次のコマンドを入力します。少し複雑かつ長いコマンドなので、コピペするのが確実です。このコマンドは2行あります(source ~/.zshrcが2行目)。2行分コピーして、ちょっと前に実行したターミナルにペースト(貼り付け)を実行します。
/Users/Shared/miniforge3/bin/conda init zsh
source ~/.zshrcもう一度conda [ENTER]を試して、ちゃんと起動することを確認してください。
さきほどインストールしたMiniforgeには、Pythonの機能を拡張するさまざまなライブラリが入っています。これらは日々、世界中に散在する開発者によって更新されていきます。よって、Miniforgeに含まれているライブラリも、最新のバージョンにしておく方がよいです。
そのために、次のコマンドをターミナルで実行します:
conda update -n base conda -yすると、たったいまインストールしたばかりのminiforgeに含まれるパッケージの中で更新されているものを検知し、最新のバージョンを自動的にダウンロード、インストールしてくれます。
下図では、ca-certificatesというパッケージだけが更新されている様子を表しています。みなさんのMacでは、このコマンドを実行したタイミングの時点で最新のパッケージに更新されるはずです。
今回miniforgeの中でインストールしたPythonに加えて、実はMacでは、Appleがカスタマイズした独自のPythonがプレインストールされていて、OSの管理や制御に用いています。このApple独自Pythonを使ってプログラミングすることも不可能ではないですが、データサイエンスに役立つライブラリは入っていません。このApple独自PythonはOSの管理専用としてキープしておき、私たちはノータッチでいきましょう。
その代わり、Miniforgeの中で「使用が完結する」Pythonを使うことになります。このためにMac OSの中に「Miniforgeをベースとした、データサイエンス専用Pythonエコシステム」を構築します。このようなエコシステムを、「仮想環境」と呼びます。
この授業だけでなく、その他のPythonを使う授業や来年度のゼミでの研究活動のために新しい仮想環境を作成します。新しい仮想環境には名前をつけることができ、名前は何でもよいのですが、短く簡潔に「ds」と命名
します。データサイエンス(data
science)の略です。Pythonのバージョンは、主要なデータサイエンス・機械学習ライブラリの動作確認がある3.12とします。次のコマンドをターミナルで実行してください:
conda create -n ds python=3.12 -yENTERして実行すると、多くの情報が出力されながら仮想環境 ds が作成されます。下図のような画面になったら、作成成功です。
上の画面の最後に指示があるようにターミナルで次のコマンドを実行し、仮想環境 ds を有効化します:
conda activate dsターミナルの入力行の先頭に(ds)が追加されます。これは、現在このターミナルはPythonの仮想環境「ds」を動かしているという意味です。
実際に、利用可能なPythonをチェックします。ターミナルにpython --version [ENTER]と入力してください。
(ds) ユーザ名@Mac名 Downloads % python --version
Python 3.12.11仮想環境「ds」では、Python 3.12.XX(XXはバージョン番号)が使えることが分かります。
仮想環境「ds」に、この授業やゼミで利用する、データサイエンス定番ライブラリをインストールします。次のコマンドをターミナルで実行してください。
conda install -y jupyterlab ipykernel numpy pandas matplotlib seaborn scipy scikit-learnたくさんのライブラリがすごい勢いで一括インストールされる様子を目にすると思います。
jupyterlab, ipykernel:Visual Studio
Codeエディタとの連携numpy, pandas:データ操作ライブラリmatplotlib, seaborn:グラフ可視化ライブラリscipy, scikit-learn:統計・機械学習関連ライブラリどのライブラリも世界標準となっているものです。データ分析を行う人なら、学生からプロフェッショナルを問わず、皆使っています。
日本語を操る私たちにとって、世界標準なライブラリを使う際に乗り越えるべき悩みは、グラフの日本語表示の文字化け問題です。日本人の有志の方々が公開しているmatplotlib_fontjaというライブラリを導入すれば、その悩みから(ほぼ)解放されます。このライブラリはminiforgeシステムには登録されていないので、次のコマンドをターミナルで実行することで、インストールします。
python -m pip install matplotlib_fontjaコマンドを実行すると、次のようにダウンロードが自動的に始まり、matplotlib_fontjaに関連する必須ライブラリも自動的にインストールされていきます:
インストールが終わると、ターミナルの出力の下の方にSuccesfully installed ...というメッセージが表示されます↓
miniforge関連の最後の作業にとりかかります。今はターミナルに色々なコマンドを入力したり、かなり複雑なことをやっていますが、授業や研究ではターミナルはほぼ使わず、VS Codeエディタのみの「シンプルな作業環境」を使います。VS CodeとMiniforge(Python)とRを連携させる仕組みがjupyterというライブラリです。jupyterは仮想環境(ds)をVS Codeから直接使う機能を提供します。
ターミナルが仮想環境dsにいることを確認し、次のコマンドを実行してください:
python -m ipykernel install --user --name ds --display-name "Python(ds)"ターミナルの出力にInstalled kernelspec ds in ...と表示されれば成功です。これは、仮想環境dsをVS
Codeで使う準備を行なったというメッセージです。
ここまででおそらく30-40分くらいかかったのではないかと思います。以上でPythonプログラミング環境はほぼ完成です。残りの作業は
既にRStudioでRを動かしたことがある人は、Rのインストール作業は不要です。 4.Rカーネルの設定に進んでください。
Mac版 R のインストール方法は、以下のページがとても親切です。ここに書いてある通りの手順で作業を行い、最後の動作確認まで完了してください。
https://bigdata-analytics.jp/install-tools/install_r_for_mac/
アプリケーションフォルダの中にあるR.appを起動します。
出現したRコンソールに、以下のコマンドを入力(またはコピペ)します。
install.packages("IRkernel")すると、Rコンソールに:
--- Please select a CRAN mirror for use in this session ---というメッセージが表示され、ダウンロード先のサーバーリスト一覧が表示された新しいウィンドウが現れることがあります。
リストの最上部にある0-Cloud[https]をマウスで選択して、[OK]ボタンをクリックしればインストール作業が再開されます。インストールはあっという間に終わって下のような画面になります:
Rは一旦終了します(Save Workspace Image?とか聞かれたら、Noを選択します)
再びターミナル.appに戻ります。もしターミナルを終了していたら、ターミナルを起動して、次のコマンドを実行し、既に作成した仮想環境「ds」に入ります。
conda activate ds上図のようにターミナルの入力行が (ds) ユーザー名@Mac名
と表示されていて、先頭に(ds)がついていることを確認してください。
ここで、さきほど起動したRのコマンドバージョンを起動します。次のコマンドをコピペして実行してください:
/Library/Frameworks/R.framework/Resources/bin/R下の画像は、コマンドバージョンのRが起動した状況を表しています。
表示されているのは、Rコンソールです。Rコンソールに次の2行をコピペして実行してください。
library(IRkernel)
IRkernel::installspec()上図のように実行すると、何も起こりませんがそれでOKです。むしろエラーっぽい状況が発生したら、私に相談してください。
以上でminiforgeとRのリンクは確立されました。Rを終了しましょう。Rコンソールにq()[ENTER]と入力してSave workspace image? [y/n/c]と表示されるので、キーボードのnを入力すれば、Rは終了します。
https://code.visualstudio.com/ から VS Code をダウンロードします。SafariやChromeでこのWebサイトを開くと、目立つところに林檎マーク+Download for macOSというリンクが見えるので、それをクリックしてダウンロードを開始します。
ダウンロードフォルダを開いて、Visual Studio Codeというアプリを探し出します。これがVS Codeです。これをアプリケーションフォルダにコピーします。
アプリケーションフォルダにコピーしたVisual Studio Codeをダブルクリックして開きます。VS Codeはよく使うエディタになるはずなので、デスクトップのツールバーに登録しておくとよいと思います↓
VS
Codeはデフォルトでは英語表示になっています。ウィンドウ左端の「拡張機能アイコン」をクリックし、検索窓にjapaneseと入力します。すると、Japanese
Language Pack for Visual Studio
Codeという拡張機能があります。これはVS
Codeの外観やメニューをできる限り日本語表示してくれます。
右下に青字に白文字で「install」というボタンがあるので、それをクリックすると、拡張機能がインストールされ、自動的に再起動して、日本語化された VS Codeが出現します。よく使うメニューや説明が日本語に切り替わります。
検索窓にPythonと入力して下さい。そして出現した拡張機能のうち、次の2つを見つけます
これらも同様にインストールします。
検索窓にJupyterと入力して下さい。そして出現した拡張機能のうち、次の3つを見つけて、インストールしてください。
以上でPython+Rのプログラミング環境の基本設定は完成です!
VSCodeとターミナルを終了してOKです。